• Àüü
  • ÀüÀÚ/Àü±â
  • Åë½Å
  • ÄÄÇ»ÅÍ
´Ý±â

»çÀÌÆ®¸Ê

Loading..

Please wait....

Çмú´ëȸ ÇÁ·Î½Ãµù

Ȩ Ȩ > ¿¬±¸¹®Çå > Çмú´ëȸ ÇÁ·Î½Ãµù > Çѱ¹Á¤º¸°úÇÐȸ Çмú´ëȸ > KCC 2021

KCC 2021

Current Result Document : 7 / 16 ÀÌÀü°Ç ÀÌÀü°Ç   ´ÙÀ½°Ç ´ÙÀ½°Ç

ÇѱÛÁ¦¸ñ(Korean Title) È¥ÇÕ Á¤¹Ðµµ¿Í ¼±Çü º¯È¯À» ÀÌ¿ëÇÑ ¾çÀÚÈ­ µÈ ½ÉÃþ ½Å°æ¸ÁÀÇ Ãß·Ð ¼º´É °³¼± ¹× ÀúÀå °ø°£ Ãà¼Ò
¿µ¹®Á¦¸ñ(English Title) Improving Inference Performance and Reducing Storage Space of Quantized DNN by Using Mixed-precision and Linear Transformation
ÀúÀÚ(Author) Á¶µ¿ºó   ¼­Áö¿ø   Dongbin Cho   Jiwon Seo  
¿ø¹®¼ö·Ïó(Citation) VOL 48 NO. 01 PP. 0751 ~ 0753 (2021. 06)
Çѱ۳»¿ë
(Korean Abstract)
¾çÀÚÈ­(Quantization) ±â¹ýÀº µ¥ÀÌÅ͸¦ Ç¥ÇöÇÏ´Â ÀÚ·áÇüÀÇ Å©±â¸¦ Ãà¼Ò½ÃÅ°´Â ±â¼ú·Î, ¼ÒÇÁÆ®¿þ¾î°¡ ¿ä±¸ÇÏ´Â °è»ê·® ¹× ÀúÀå °ø°£ÀÇ ¼öÁØÀ» ³·Ãß±â À§ÇØ »ç¿ëÇÑ´Ù. ¸¹Àº ½ÉÃþ ½Å°æ¸Á(Deep Neural Network) ¸ðµ¨µéÀ» ¾çÀÚÈ­ ÇÒ ¶§ 8bit ÀÚ·áÇüÀ» ÁÖ·Î »ç¿ë´Âµ¥, ÀÌ´Â ¸ðµ¨À» 4bit ÀÚ·áÇüÀ¸·Î ¾çÀÚÈ­ ÇÒ °æ¿ì ¸ðµ¨ÀÇ ¼º´ÉÀÌ Å©°Ô ÀúÇϵDZ⠶§¹®ÀÌ´Ù. º» ³í¹®¿¡¼­´Â INT4 ÀÚ·áÇü°ú INT8 ÀÚ·áÇüÀ» ¸ðµÎ »ç¿ëÇϴ ȥÇÕ Á¤¹Ðµµ¸¦ ÀÌ¿ëÇÏ¿© µÎ ÀÚ·áÇüÀÇ ÀÌÁ¡À» ¸ðµÎ ÃëÇÒ ¼ö ÀÖ´Â ±â¹ýÀ» Á¦¾ÈÇÑ´Ù. Á¦¾ÈÇÏ´Â ±â¹ýÀº 1)¾çÀÚÈ­ ½Ã Á¤º¸ ¼Õ½ÇÀÌ ¸¹Àº °èÃþ¿¡ ³ôÀº Á¤¹ÐµµÀÇ ÀÚ·áÇüÀ» Àû¿ëÇÏ°í, 2) Ãß·Ð ½Ã È¥ÇÕ Á¤¹ÐµµÀÇ ÀÚ·áÇüÀ» ¼±Çüº¯È¯ ÇÏ¿© ÇϳªÀÇ ÀÚ·áÇüÀ¸·Î ÅëÇÕ ÈÄ °è»êÇÏ´Â °ÍÀÌ´Ù. ½ÇÇè °á°ú INT4 ´ÜÀÏ Á¤¹Ðµµ ¾çÀÚÈ­ ¸ðµ¨°ú À¯»çÇÑ ÀúÀå °ø°£À» »ç¿ëÇßÀ¸¸ç, INT8 ´ÜÀÏ Á¤¹Ðµµ ¾çÀÚÈ­ ¸ðµ¨°ú À¯»çÇÑ ¼º´ÉÀ» À¯ÁöÇß´Ù.
¿µ¹®³»¿ë
(English Abstract)
Å°¿öµå(Keyword)
ÆÄÀÏ÷ºÎ PDF ´Ù¿î·Îµå